ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی

thesis
abstract

امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد موتورهای جستجو و بالا بردن اطمینان کاربران به آنها گردد. وب فریبکارانه پدیده ای است که پیدایش آن همزمان با ظهور وب بوده و در سا ل های اخیر بسیار شایع شده است. روش های مختلفی برای تولید صفحات فریب آمیز مورد استفاده قرار می¬گیرند اما همیشه با توجه به الگوریتم¬هایی که موتورهای جستجو برای رتبه¬بندی صفحات وب به کار می برند ترفندهای جدید فریبکاری ابداع می شود. فریبگرها از دو روش کلی فریبکاری مبتنی بر محتوا و فریبکاری مبتنی بر پیوند برای فریب موتورهای جستجو استفاده می کنند. در این پایان نامه ابتدا به معرفی روش ها و الگوریتم های مختلف تشخیص صفحات وب فریب آمیز می پردازیم. در نهایت روشی جدید جهت شناسایی صفحات فریب آمیز در گراف وب فارسی ارائه می گردد. این روش ترکیبی از روش های مبتنی بر محتوا و پیوند است و با بهره گیری از اطلاعات محتوا و پیوند، صفحات فریب آمیز را شناسایی می کند. این روش بر روی داده های موتور جستجوی فارسی پارسی جو پیاده سازی شده است و نتایج ارزیابی های صورت گرفته قبل از پیاده سازی این الگوریتم و پس از آن بهبودی برابر با 21.2% را در فاکتور دقت نشان می دهد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز

با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...

15 صفحه اول

ارائه روشی جهت ارزیابی صحت عملکرد کیت تشخیص انتروباکتریاسه

یکی از مهمتین گروه های باکتری گرم منفی، خانواده انتروباکتریاسه است که به منظور تشخیص آن آز روش های مختلفی نظیر تست های لوله ای و همچنین روش های نوین آزمایشگاهی این امر محقق می شود. با این وجود، با توجه به مشکلاتی روش های سنتی کشت لوله ای همچون هزینه نیروی انسانی، مالی و زمانی که برای آماده سازی محیط کشت، آلودگی های میکروبی، دشواری ساخت محیط های کشت مختلف و ... استفاده از روش های نوین آزمایشگ...

full text

ارائه روشی برای پیش‌پردازش تصویر جهت بهبود عملکرد JPEG

A lot of researchs have been performed in image compression and different methods have been proposed. Each of the existing methods presents different compression rates on various images. By identifing the effective parameters in a compression algorithm and strengthen them in the preprocessing stage, the compression rate of the algorithm can be improved. JPEG is one of the successful compression...

full text

بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش ...

full text

ارائه روشی برای پیش پردازش تصویر جهت بهبود عملکرد jpeg

تاکنون کارهای زیادی در مورد فشرده سازی تصویر انجام گرفته و روش­های متفاوتی ارائه شده­اند. هر یک از این روش­ها بر روی تصاویر مختلف، میزان فشرده­سازی متفاوتی را ارائه می­دهند. با شناسایی پارامترهای تاثیرگذار در یک الگوریتم فشرده­سازی و تقویت آنها در مرحله پیش‎پردازش، میزان فشرده­سازی آن الگوریتم را می­توان بهبود بخشید. jpeg یکی از روش­های فشرده­سازی موفق می­باشد که کارهای زیادی نیز برای بهبود عمل...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023